A 'Silent Trial' Assessing the Accuracy of Large Language Models for Assisting Community Health Workers in Low-Resource Settings
Uno studio condotto in Ruanda ha rivelato che, sebbene gli operatori sanitari comunitari locali mostrino un'elevata accuratezza nelle decisioni di riferimento, i modelli di linguaggio artificiale variano notevolmente nelle prestazioni (con o3 di OpenAI che si avvicina ai livelli umani e Gemini Flash 2.5 che risulta inadeguato), suggerendo che l'implementazione di tali tecnologie sia critica e attualmente più utile in contesti con programmi sanitari meno consolidati.
Shimelash, N., Rutunda, S., Menon, V., Emmanual-Fabula, M., Uwimbabazi, A., Rugege, C., Nshimiyimana, C., Rwema, I., Kandekwe, M., Berhe, D. F. D., Wong, R., Remera, E., Hezagira, E., Gill, J., Archer (…)2026-02-17📄 primary care research